查看原文
其他

手把手教你定组分分子结构预测、无序结构预测!

USPEX粉 研之成理 2021-12-21
笔者前面已经介绍了USPEX官方案例1-8,相信坚持阅读这个教程系列的读者,应该也很期待后面官方案例是计算什么的。为了满足读者的愿望,笔者也只有牺牲自己的空闲的时间继续搬砖,只为了完成这个系列,使得这个系列教程成为非官方的最全的计算指导文档!

下面长话短说,直接介绍官方教程9-13,希望大家能跟随教程学会定组分分子结构预测(案例9、10、11)、二元变组分结构预测结果分析(案例12)以及无序结构预测(案例13)。

一、 USPEX官方案例讲解(9-13)

案例9:预测有4个甲烷分子的单胞在20 GPa下最稳定结构,结构优化采用的是VASP。
分子?这个我们还是第一次遇到,现在来看看怎么一回事?


可以看到案例9多出一个MOL_1的文件,现在我们先看看这个MOL_1文件有些什么:


这个文件在手册里面第5章里面有介绍,也可以在线观看https://uspex-team.org/online_utilities/uspex_manual_release/ChineseVersion/uspex_manual_chinese_V10.2/sect0029.html,里面还介绍怎么通过XYZ坐标格式的文件来创建USPEX使用的MOL文件。手册上面这块讲的挺麻烦的,让笔者摸不着头脑,毕竟笔者对于分子接触的少。但是从朱强博士相关论文中,可以读到这个文件设置的作用:在USPEX产生分子结构的时候进行约束,这样大大降低搜索空间,减少计算量;其次,任何分子的能量值,都要比其分解为水和盐的化合物的能量值低。

进行分子结构预测时的INPUT.txt又需要注意哪些呢?


第5行、calculationType:310 三维分子定组分。
第14行、numSpecies:1 4,这个官方案例有点问题,少了一个1,知道为啥不?
第35-38行、IonDistances,设置不同原子类型之间的最小原子间距离矩阵,而低于离子距离低于这个距离都被认为没有物理意义的,将被忽略!这里只有两种原子,所以只设置两行就行!第36行的2.0,表示C原子和C原子之间的最小距离,1.7表示C原子和H原子之间的最小距离;第37行的0.7表示H原子和H原子之间的最小距离。这些值都要比真实健值要小!


第40-42行、MolCenters,设置分子中心之间最小距离的矩阵,而任何低于这值的距离都表明分子有很大的重叠,是没有物理意义的,将被严格避免!第41行的2.8表示CH4的最小距离,单位为埃。进行分子结构预测时,这个必须设置!


INPUT.txt其余的参数在前面的案例中,已经介绍了。可以看出结构优化时,计算CH4结构的能量采用的是VASP,那么Specific文件夹里面就是INCAR五部曲和C、H原子的赝势!当然进行计算时,Seeds文件夹依旧是POSCARS,里面放的是C、H原子的最稳定的结构!可以看到除了多了MOL_1文件和INPUT.txt部分参数不一样外,分子结构预测跟其他晶体预测设置不一样?

下面我们来看看参考结果的reference文件夹:


里面也有MOL_1文件,这个是从之前的那个MOL_1拷贝过来的。其余的文件格式和内容与之前介绍的定成分计算的文件格式和内容都是一样!


案例9总共计算了9代197个结构,其中最稳定的结构也是这个对称性最低的CH4


案例10:预测有8个甲烷分子的单胞在常压下最稳定结构,结构优化采用的是DMACRYS;跟案例9类似,就不介绍了!

案例11:预测有2个尿素分子的单胞在常压下最稳定结构,结构优化采用的是TINKER;跟案例9、10类似,就不介绍了!

案例12:预测Mo-B二元体系常用最稳定的结构,变组分的结构预测,结构优化是采用Lennard-Jones对势的GULP做的。
案例12跟入门教程的La-H二元体系变组分结构预测是相似的,只是结构优化软件的软件包是不一样的,所以INPUT.txt就不介绍了。而在La-H二元变组分结构预测中,没来得及对计算结果进行分析,这次就在本教程对变组分的结果进行详细讨论。

我们先看参考答案reference文件夹里面有哪些文件:


这次文件夹里面有很多文件,又有些文件和定组分不同,但是对于变组分结构预测而言,只有extended_convex_hullextended_convex_hull_POSCARSextendedConvexHull.pdfOUTPUT.txt这四个文件最重要,彻底掌握了这四个文件就掌握了变组分结构预测的结果分析。

下面先来看看老朋友OUTPUT.txt,看一下Mo-B变组分运算过程的信息:


可以看到总共计算了60代共5287个结构,最后列出来最稳定的成分,也就是凸包线点:Mo4、B6、MoB14、Mo4B8、Mo4B4、Mo2B6。(ps: 凸包线上稳定的单胞)。那么现在读者肯定很想知道凸包线是什么?直接打开extendedConvexHull.pdf!


图中绿色的点就是本次计算的结构的,而最下面的那条黑色就是凸包线,位于这条线上的点就是热力学上稳定的结构。在本图中从左到右总共有6个落在线上的点,和OUTPUT.txt里面的6个稳定的成分是相对应的。读者应该知道能够很清楚的知道X轴代表什么意思,怎么计算的。而Y轴形成焓(Enthalpy of formation,eV/atom)是由下面公式计算出来的:
Y = (E(AxBy)-x*E(A)-y*E(B))/(x+y)
在案例12中,x: Mo原子的个数,y:B原子的个数。

而凸包线画法麻烦一点,先从两个端点开始,连接焓值最低点,然后找到端点到焓值最低点这段直线中下方最远的点,连线。迭代下去,直到没有一个点位于凸包线下面!
这条线的做法决定了稳定的结构都位于凸包线上。 假如有一个稳定的点在凸包线上方,那么它很容易分解为距离这个点最近的凸包线上的两个稳定点,有点类似直线方程的意思。

读者需要仔细体会上面一段内容,因为理解了上面的观点也就明白了变组分结构预测中凸包线的意思,那么一大堆相关论文也就会明白了。
既然我们得到知道稳定的成分,那么它们具体的结构是什么了?先看一下extended_convex_hull文件:


这个文件有些意思,第1-4行解释了extended_convex_hull文件的X、Y和Fitness这些标题的含义,其中X、Y和extendedConvexHull.pdf中X、Y轴是一一对应的,而Fitness这个就是结构离凸包线的距离,值为0意思就是在凸包线上,而值大于0就是在为凸包线上方,那么一个小小的思考题来了:为什么这个文件中没有Fitness值小于0的?(提示:思考凸包线的画法)

现在我们把注意放在第7-12行,因为它们Fitness的值为0,也就是说它们就是凸包线上的点。再看一下它们的Compositions和Enthalpies值,与OUTPUT.txt里面的值是一一对应的,综合以上信息,可以确定以上6个结构就是我们要找的稳定结构。从第13行往后就是根据Fitness从小到大排下去的,也可以认为这是根据稳定性排下去的,当然大部分情况下,这些结构都是不需要考虑的!既然我们知道要找到的稳定结构,那么怎么找到这些结构的原子坐标?这就需要看看extended_convex_hull_POSCARS了:


整个文件就是POSCAR的集合,并且每个结构的表头和之前的BESTgatheredPOSCARS是一样的,再加上第1行和第25行的ID,与extended_convex_hull里面前两个稳定结构的ID是一一对应的,那么显而易见extended_convex_hull_POSCARS文件和extended_convex_hull文件里面的结构是一一对应的。

既然知道这些预测出的稳定新结构了,就可以继续通过DFT计算它们的性质,然后得到数据,发Paper了,这还不简单?
这就是变组分结构预测需要了解和处理的文件:extended_convex_hullextended_convex_hull_POSCARSextendedConvexHull.pdfOUTPUT.txt除了凸包线画法需要用心体会,其余很简单吧!

案例13:USPEX能很容易地找到最无序的合金结构。这个案例只是为了演示TixCo(1-x)O。您需要在/Seeds/POSCARS中指定初始结构,并且只使用置换突变操作。在这种情况下,不需要使用任何外部代码。在这个例子中,我们优化(最小化)结构有序度(Oganov and Valle(2009);Lyakhov Oganov Valle(2010))而不需要进行结构优化(abinitioCode=0)。种子结构(Ti-Co-O结构的超级细胞)中的Ti原子和Co原子置换,以寻找具有最小的有序度。在这种情况下最小化有序度,我们得到了“特殊准随机结构”的广义形式。

这个案例的说明比较饶舌,还是直接看INPUT.txt吧:


第6行、optType: -4,寻找有序最小的结构!因为4是寻找有序度最大的结构,所以-4是相反的意思。
第30行、howManySwaps:15,设置为这个值,是因为在第29行设置本次计算的子代结构都是通过交换父代结构中的原子产生的。本次计算的Co16Ti16O64的单胞,总共有96个原子,这个值占比15%左右。


第32-34行、specificSwaps:


1 2,指明只有Co、Ti原子能进行置换。

其余没有什么新鲜的参数要介绍了,不过读者可能会注意到,本次并没有进行结构优化,或者说是调用外部软件进行计算。都是USPEX通过自己的Fingerprint算法来计算有序度,这个具体是怎么一回事?可以参考这个在线网址(https://uspex-team.org/online_utilities/fingerprints2/)。

好了,再把Seeds/POSCARS文件准备好:放入Co、Ti、O原子所有稳定的结构信息进去就OK了。至于计算,本地计算就可以。我们先来看看结果吧(由于这次是300计算,结果只是需要关注BESTIndividualsBESTgatheredPOSCARSOUTPUT.txt),先看一下BESTIndividuals文件:


可见BESTIndividuals文件还是跟以前,到文件末尾总共有50代 (本图志截取到19代 ),那么问题又来了,我们需要预测的结构长什么样了?我们接着打开BESTgatheredPOSCARS文件:


可以看出这个结构还是比较复杂的,有点无序的感觉,有点高熵合金的感觉。

二、 总结

案例9:预测有4个甲烷分子的单胞在20 GPa下最稳定结构,结构优化采用的是VASP。310
案例10:预测有8个甲烷分子的单胞在常压下最稳定结构,结构优化采用的是DMACRYS; 310
案例11:预测有2个尿素分子的单胞在常压下最稳定结构,结构优化采用的是TINKER; 310
这三个都是分子结构预测:310类型的,所以只详细的介绍了310。

案例12:预测Mo-B二元体系常用最稳定的结构,变组分的结构预测,结构优化是采用Lennard-Jones对势的GULP做的。301
这个案例主要是介绍了结果分析,其中关于凸包线的那段值得读者思考一下,弄明白了,很多Paper都能理解了。

案例13:预测最无序的TixCo(1-x)O合金结构。300
这个案例主要介绍无序结构预测,有点准随机的感觉,目前笔者感觉其在高熵合金方面有潜在用途。

三、 写在后面的话

笔者感觉在分子结构预测方面,还是比较有用途的,为什么呢?想想现在全球性疫情,人类这么厉害的科学,这么旧的时间了,还是没有即时开发出预苗,很大程度上,现在大部分预苗开发者还是采用试错法来合成药物,但是现在这么强大的计算资源、预测软件和算法、量子化学软件、DFT软件、分子动力学软件和这么多成功的预测案例,为什么不试试计算的力量了?(ps: 笔者也仅仅是一个个搬砖者,井底之蛙,对于这方面也许上海药物所有所行动,或者工业界也有行动,但是真心希望理论计算技术能够稍微改变一下圈子以外的世界)。

相关推荐:理论计算预测材料,手把手教你用USPEX!
手把手教你USPEX官方案例1理论计算干货:手把手教你USPEX之官方案例讲解2-8
1. 仪器表征基础知识汇总2. SCI论文写作专题汇总3. Origin/3D绘图等科学可视化汇总4. 理论化学基础知识汇总5. 催化板块汇总6. 电化学-电池相关内容汇总贴7. 研之成理名师志汇总更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入研之成理后台自主查询。

微信加群


催化/能源交流群,请添加微信:yzcl93
理论计算交流群,请添加微信:ccl2098科研绘图交流群,请添加微信:17857127498
写作/表征交流群,请添加微信:xueshan199
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存